智能论文笔记

Developing a Free and Open-source Automated Building Exterior Crack Inspection Software for Construction and Facility Managers

Pi Ko , Samuel A. Prieto , Borja Garcia de Soto

分类：计算机视觉 | 人工智能

2022-06-20

检查裂缝是正确监视和维护建筑物的重要过程。但是，手动裂缝检查是耗时，不一致且危险的（例如，在高建筑物中）。由于开源AI技术的开发，可用的无人机（UAV）的增加以及智能手机摄像机的可用性，已经有可能自动化建筑物裂纹检查过程。这项研究介绍了使用最先进的分段算法来开发一种易于使用，免费和开源的自动化建筑物外部裂纹检查软件（ABECIS），用于建筑和设施经理定量和定性报告。使用在现实世界中的无人机和智能手机摄像机和受控实验室环境中收集的图像对Abecis进行了测试。从算法的原始输出来看，用于测试实验的工会上的中值相交是（1）0.686，用于使用商业无人机在受控的实验室环境中使用商业无人机在室内裂纹检测实验，（2）0.186，用于使用室内裂纹检测在施工现场检测的室内裂纹。智能手机和（3）0.958使用商业无人机在大学校园进行户外裂纹检测。当人类操作员选择性地消除误报时，这些IOU结果可以显着提高到0.8以上。通常，Abecis最适合室外无人机图像，将算法预测与人类验证/干预相结合提供非常准确的裂纹检测结果。该软件可公开可用，可以下载以供开箱即用：https：//github.com/smart-nyuad/abecis

translated by 谷歌翻译

Guiding vector fields for the distributed motion coordination of mobile robots

Weijia Yao , Hector Garcia de Marina , Zhiyong Sun , Ming Cao

分类：机器人

2022-09-20

我们提出协调指导矢量字段，以与机器人团队同时完成两个任务：首先，多个机器人的指导和导航到可能嵌入2D或3D中的可能不同的路径或表面；其次，他们的运动协调在跟踪他们的规定路径或表面时。运动配位是由路径或表面上的机器人之间所需的参数位移定义的。通过控制对应于指导矢量场之间的路径或表面参数的虚拟坐标来实现这种所需的位移。由动力学系统理论和Lyapunov理论支撑的严格数学保证，用于从所有初始位置上有效的分布式运动协调和机器人在路径或表面上导航。作为实用机器人应用的一个例子，我们从所提出的具有驱动饱和度的Dubins-car样模型的指导向量场中得出了一种对照算法。我们提出的算法分布并可扩展到任意数量的机器人。此外，广泛的说明性模拟和固定翼飞机户外实验验证了我们算法的有效性和鲁棒性。

translated by 谷歌翻译

Label Refinement Network from Synthetic Error Augmentation for Medical Image Segmentation

Shuai Chen , Antonio Garcia Uceda , Jiahang Su , Gijs van Tulder , Lennard Wolff , Theo van Walsum , Marleen de Bruijne

分类：计算机视觉

2022-09-14

用于图像分割的深卷卷卷神经网络不会明确学习标签结构，并且可能会在类似树状结构（例如气道或血管）分割的圆柱形结构中产生不正确的结构（例如，具有断开的圆柱形结构）的分割。在本文中，我们提出了一种新型的标签改进方法，以从初始分割中纠正此类错误，并隐含地包含有关标签结构的信息。该方法具有两个新颖的部分：1）生成合成结构误差的模型，以及2）产生合成分割（带有误差）的标签外观仿真网络，其外观与实际初始分段相似。使用这些合成分割和原始图像，对标签改进网络进行了训练，以纠正错误并改善初始分割。该方法对两个分割任务进行了验证：来自胸部计算机断层扫描（CT）扫描和大脑3D CT血管造影（CTA）图像的脑血管分割的气道分割。在这两种应用中，我们的方法都大大优于标准的3D U-NET和其他先前的改进方法。当使用其他未标记的数据进行模型培训时，改进甚至更大。在消融研究中，我们证明了所提出方法的不同组成部分的值。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Unlocking High-Accuracy Differentially Private Image Classification through Scale

Soham De , Leonard Berrada , Jamie Hayes , Samuel L. Smith , Borja Balle

分类：机器学习 | 计算机视觉 | (统计)机器学习

2022-04-28

差异隐私（DP）提供了正式的隐私保证，以防止对手可以访问机器学习模型，从而从提取有关单个培训点的信息。最受欢迎的DP训练方法是差异私有随机梯度下降（DP-SGD），它通过在训练过程中注入噪声来实现这种保护。然而，以前的工作发现，DP-SGD通常会导致标准图像分类基准的性能显着降解。此外，一些作者假设DP-SGD在大型模型上固有地表现不佳，因为保留隐私所需的噪声规范与模型维度成正比。相反，我们证明了过度参数化模型上的DP-SGD可以比以前想象的要好得多。将仔细的超参数调整与简单技术结合起来，以确保信号传播并提高收敛速率，我们获得了新的SOTA，而没有额外数据的CIFAR-10，在81.4％的81.4％下（8，10^{ - 5}） - 使用40 -layer wide-Resnet，比以前的SOTA提高了71.7％。当对预训练的NFNET-F3进行微调时，我们在ImageNet（0.5，8*10^{ - 7}）下达到了83.8％的TOP-1精度。此外，我们还在（8，8 \ cdot 10^{ - 7}）下达到了86.7％的TOP-1精度，DP仅比当前的非私人SOTA仅4.3％。我们认为，我们的结果是缩小私人图像分类和非私有图像分类之间准确性差距的重要一步。

translated by 谷歌翻译

Overview of The MediaEval 2021 Predicting Media Memorability Task

Rukiye Savran Kiziltepe , Mihai Gabriel Constantin , Claire-Helene Demarty , Graham Healy , Camilo Fosco , Alba Garcia Seco de Herrera , Sebastian Halder , Bogdan Ionescu , Ana Matran-Fernandez , Alan F. Smeaton

分类：计算机视觉 | 人工智能

2021-12-11

本文介绍了预测媒体难忘性的Mediaeval 2021，这是今年第4版的任务，因为短期和长期视频难忘性的预测仍然是一个具有挑战性的任务。在2021年，使用两个视频数据集：第一，TRECVID 2019视频到文本数据集的子集;其次，Memento10K数据集是为了提供探索交叉数据集泛化的机会。另外，介绍了基于脑电图（EEG）的预测导频子任务。在本文中，我们概述了任务的主要方面，并描述了参与者提交的数据集，评估指标和要求。

translated by 谷歌翻译

NL-Augmenter: A Framework for Task-Sensitive Natural Language Augmentation

Kaustubh D. Dhole , Varun Gangal , Sebastian Gehrmann , Aadesh Gupta , Zhenhao Li , Saad Mahamood , Abinaya Mahendiran , Simon Mille , Ashish Srivastava , Samson Tan

分类：自然语言处理 | 人工智能 | 机器学习

2021-12-06

数据增强是自然语言处理（NLP）模型的鲁棒性评估的重要组成部分，以及增强他们培训的数据的多样性。在本文中，我们呈现NL-Cogmenter，这是一种新的参与式Python的自然语言增强框架，它支持创建两个转换（对数据的修改）和过滤器（根据特定功能的数据拆分）。我们描述了框架和初始的117个变换和23个过滤器，用于各种自然语言任务。我们通过使用其几个转换来分析流行自然语言模型的鲁棒性来证明NL-Upmenter的功效。基础架构，Datacards和稳健性分析结果在NL-Augmenter存储库上公开可用（\ url {https://github.com/gem-benchmark/nl-augmenter}）。

translated by 谷歌翻译

An Annotated Video Dataset for Computing Video Memorability

Rukiye Savran Kiziltepe , Lorin Sweeney , Mihai Gabriel Constantin , Faiyaz Doctor , Alba Garcia Seco de Herrera , Claire-Helene Demarty , Graham Healy , Bogdan Ionescu , Alan F. Smeaton

分类：计算机视觉 | 人工智能

2021-12-04

使用公共可用链路的集合，平均每周6秒的视频剪辑，每次，1,275用户多次手动注释每个视频，以指示视频的长期和短期难忘性。注释作为在线记忆游戏的一部分，并测量了参与者在显示视频的集合时先前召回过视频的能力。在前几分钟内看到的视频进行识别任务，以进行短期令人难忘，以便在前24到72小时内进行长期难忘。数据包括每个视频的每个识别的反应时间。与每个视频相关联是文本描述（标题）以及应用于从每个视频中提取的3帧的图像级别功能集合（开始，中间和结束）。还提供了视频级功能。数据集在视频难忘任务中使用，作为2020年的Mediaeval基准的一部分。

translated by 谷歌翻译

DensePose From WiFi

Jiaqi Geng , Dong Huang , Fernando De la Torre

分类：计算机视觉

2022-12-31

Advances in computer vision and machine learning techniques have led to significant development in 2D and 3D human pose estimation from RGB cameras, LiDAR, and radars. However, human pose estimation from images is adversely affected by occlusion and lighting, which are common in many scenarios of interest. Radar and LiDAR technologies, on the other hand, need specialized hardware that is expensive and power-intensive. Furthermore, placing these sensors in non-public areas raises significant privacy concerns. To address these limitations, recent research has explored the use of WiFi antennas (1D sensors) for body segmentation and key-point body detection. This paper further expands on the use of the WiFi signal in combination with deep learning architectures, commonly used in computer vision, to estimate dense human pose correspondence. We developed a deep neural network that maps the phase and amplitude of WiFi signals to UV coordinates within 24 human regions. The results of the study reveal that our model can estimate the dense pose of multiple subjects, with comparable performance to image-based approaches, by utilizing WiFi signals as the only input. This paves the way for low-cost, broadly accessible, and privacy-preserving algorithms for human sensing.

translated by 谷歌翻译

Machine Learning and Thermography Applied to the Detection and Classification of Cracks in Building

Angela Busheska , Nara Almeida , Nicholas Sabella , Eudes de A. Rocha

分类：计算机视觉 | 机器学习

2022-12-30

Due to the environmental impacts caused by the construction industry, repurposing existing buildings and making them more energy-efficient has become a high-priority issue. However, a legitimate concern of land developers is associated with the buildings' state of conservation. For that reason, infrared thermography has been used as a powerful tool to characterize these buildings' state of conservation by detecting pathologies, such as cracks and humidity. Thermal cameras detect the radiation emitted by any material and translate it into temperature-color-coded images. Abnormal temperature changes may indicate the presence of pathologies, however, reading thermal images might not be quite simple. This research project aims to combine infrared thermography and machine learning (ML) to help stakeholders determine the viability of reusing existing buildings by identifying their pathologies and defects more efficiently and accurately. In this particular phase of this research project, we've used an image classification machine learning model of Convolutional Neural Networks (DCNN) to differentiate three levels of cracks in one particular building. The model's accuracy was compared between the MSX and thermal images acquired from two distinct thermal cameras and fused images (formed through multisource information) to test the influence of the input data and network on the detection results.

translated by 谷歌翻译